草庐IT

xml - XPath 兄弟提取

全部标签

ruby - XPath 轴,获取所有后续节点直到

我有以下HTML示例:FoobarloremipsumetcBarbazdumdumdumpoopfiddles我希望提取“Foobar”标题后的所有段落,直到到达“Barbaz”标题(“Barbaz”标题的文本未知,所以很遗憾我无法使用答案由bougyman提供)。现在我当然可以使用//h2[text()='Foobar']/following::p之类的东西,但这当然会抓取此后的所有段落header。因此,我可以选择遍历节点集并将段落插入数组,直到文本与下一个header的文本相匹配,但老实说,这远不如在XPath中完成这件事那么酷。有没有办法做到这一点我想念的?

ruby - 使用 Nokogiri 插入和删除 XML 节点和元素

我想提取XML文件的一部分,并记下我提取了该文件中的某些部分,例如“这里提取了一些东西”。我正尝试用Nokogiri来做这件事,但似乎并没有真正记录如何:删除的所有child更改inner_text那个完整的元素有什么线索吗? 最佳答案 Nokogiri让这一切变得非常简单。使用thisdocument例如,以下代码将找到所有vitamins标签,删除它们的子标签(以及子标签的子标签等),并将它们的内部文本更改为“Childrenremoved”。require'nokogiri'io=File.open('sample.xml',

ruby - 如何从 Ruby 中的较大字符串中提取单个字符(作为字符串)?

从字符串中检索单个字符作为单字符字符串的Ruby惯用方法是什么?当然有str[n]方法,但是(从Ruby1.8开始)它返回一个字符代码作为fixnum,而不是字符串。你如何获得单字符字符串? 最佳答案 在Ruby1.9中,这很容易。在Ruby1.9中,字符串是可识别编码的字符序列,因此您只需对其进行索引即可从中获取单字符字符串:'µsec'[0]=>'µ'然而,在Ruby1.8中,字符串是字节序列,因此完全不知道编码。如果您对一个字符串进行索引并且该字符串使用多字节编码,则可能会索引到多字节字符的中间(在此示例中,'µ'以UTF-8

ruby - 如何创建 nokogiri 不区分大小写的 Xpath 选择器?

我正在使用nokogiri来选择“关键字”属性,如下所示:putspage.parser.xpath("//meta[@name='keywords']").to_html我正在使用的其中一个页面的关键字标签带有大写字母“K”,这促使我使查询不区分大小写。AND所以,我的问题是:使nokogiri选择不区分大小写的最佳方法是什么?编辑下面Tomalak的建议非常适合这个特定问题。我还想使用这个例子来帮助更好地理解nokogiri,并且有几个我想知道但没有成功搜索的问题。例如,正则表达式“伪类”是NokogiriDocs吗?适合这样的问题吗?我也很好奇nokogiri中的matches?

iphone - 如何从视频中提取方向信息?

在网络上浏览了大量文档后,iPhone似乎总是以480x360的纵横比拍摄视频,并在视频rails上应用变换矩阵。(480x360可能会改变,但对于给定设备而言始终相同)这是一种在iOS项目中修改ffmpeg源代码并访问矩阵http://www.seqoy.com/correct-orientation-for-iphone-recorded-movies-with-ffmpeg/的方法这是在iOS-4中查找转换矩阵的更清晰的方法Howtodetect(iPhoneSDK)ifavideofilewasrecordedinportraitorientation,orlandscape.

ruby - 如何在 Ruby 中提取整数的符号?

我需要一个返回/打印整数符号的函数。到目前为止,我想出了这个:defextract_sign(integer)integer>=0?'+':'-'end是否有内置的Ruby方法可以做到这一点? 最佳答案 这里有一个简单的方法:x=-3"++-"[x0]#=>"-"x=0"++-"[x0]#=>"+"x=3"++-"[x0]#=>"+"或x=-3"±+-"[x0]#=>"-"x=0"±+-"[x0]#=>"±"x=3"±+-"[x0]#=>"+" 关于ruby-如何在Ruby中提取整数的符

ruby - 在 Ruby 中提取 URI 最后一段的最佳方法

给定的URI字符串如下:http://www.somesite.com/abchttp://www.somesite.com/alpha/beta/abchttp://www.somesite.com/alpha/abc在Ruby中获取这些URI末尾的abc最优雅的方法是什么? 最佳答案 我会使用合适的URI解析器,例如URImodule中的一个。从URI获取路径。然后在/处拆分,得到最后一部分:require'uri'URI(uri).path.split('/').last 关于ru

ruby - 是否有任何使用游标或智能提取的 Ruby ORM?

我正在寻找一个RubyORM来替代ActiveRecord。我一直在研究Sequel和DataMapper。它们看起来很不错,但是它们似乎都没有做基本的事情:在不需要时不将所有内容加载到内存中。我的意思是我已经在ActiveRecord和Sequel上尝试了以下(或等效的)在有很多行的表上:posts.each{|p|putsp}他们俩都为内存疯狂。他们似乎将所有内容都加载到内存中,而不是在需要时获取内容。我在ActiveRecord中使用了find_in_batches,但这不是一个可接受的解决方案:ActiveRecord不是一个可以接受的解决方案,因为我们在使用它时遇到了太多问题

ruby - 如何从文本中提取 URL

如何从Ruby中的纯文本文件中提取所有URL?我尝试了一些库,但在某些情况下它们会失败。什么是最好的方法? 最佳答案 如果您喜欢使用Ruby中已经为您提供的功能:require"uri"URI.extract("textherehttp://foo.example.org/blaandheremailto:test@example.comandherealso.")#=>["http://foo.example.org/bla","mailto:test@example.com"]阅读更多:http://railsapi.com/d

ruby - 如何从 Proc 对象中提取代码?

给定一个Proc对象,是否可以查看其中的代码?例如:p=Proc.new{test=0}我需要的是通过某种方式从已创建的Proc对象中获取字符串“test=0”。 最佳答案 您可以使用ruby2ruby图书馆:>>#testedwith1.8.7>>require"parse_tree"=>true>>require"ruby2ruby"=>true>>require"parse_tree_extensions"=>true>>p=Proc.new{test=0}>>p.to_ruby=>"proc{test=0}"您还可以将此过程